Gestion et rédaction bibliographiques avec l’IA

Frédérique Flamerie

2026-01-01

Introduction

Objectifs

  • Appréhender les enjeux techniques et éthiques du recours à l’intelligence artificielle pour la rédaction et la gestion bibliographiques.
  • Identifier les atouts et les limites des services d’intelligence artificielle aux différentes étapes de la rédaction et de la gestion bibliographiques, de l’import et de la mise en forme des références bibliographiques à l’exploitation d’une bibliothèque de PDF.
  • Installer et utiliser des services d’intelligence artificielle dans Zotero.

Programme

  • Contexte et enjeux
  • Typologie des usages, services et outils d’intelligence artificielle pour la rédaction et la gestion bibliographiques
  • Mise en application dans Zotero : de l’IA à toutes les étapes de la bibliographie ?

Contexte et enjeux

Usages académiques l’IA générative (GenIA)

Rédaction et gestion bibliographiques à la croisée de 2 sphères d’activités, dont elles partagent en partie les enjeux :

  • recherche bibliographique,
  • écriture académique.

Usages académiques de la GenIA : recherche

  • Au moins 60’000 articles en 2023 écrits avec l’assistance d’un LMM - soit 1% des articles indexés dans Dimensions ; 10% des articles en biomédecine du 1er semestre 2024 pour lesquels le résumé écrit avec l’aide d’une IA (Lenharo, 2024).
  • Enquête auprès de chercheurs et doctorants danois début 2024 (Andersen et al., 2025) - 3 profils d’usages :
    • GenIA comme une bête de somme (work horse) : 35,2% des répondants - GenIA pour modification code informatique, analyses statistiques, etc.
    • GenIA comme un assistant linguistique (language assistant) : 24% des répondants - GenIA uniquement pour amélioration rédaction, y compris mise en forme des références.
    • GenIA comme un accélérateur de recherche (research accelerator) : 40,7% des répondants - GenIA pour tous les usages, en particulier analyse de données.

Usages académiques de la GenIA : recherche

Types de mentions de ChatGPT dans les publications scientifiques indexées par Web of Science et Scopus. (Kousha, 2024)

Usages académiques de la GenIA : étudiants

Types d’outils utilisés par les étudiants en France - (Pascal & Taddei, 2025)

Rappels techniques

“Fonctionnement des IA” dans le cours d’A. Bouchard - (Bouchard, 2025b)

Les différents types d’IA : du chatbot à l’IA agentique

L’évolution de la recherche (Zhao, 2025)

GenIA généralistes et académiques

(Zhao, 2025) Les GenIA académiques sont fondées sur le RAG, Retrieval-Augmented Generation, ou génération augmentée de récupération.

Focus sur le RAG

GenIA simple vs. GenIA avec RAG - (Bouchard, 2025a)

Focus sur le RAG

2 points clés distinguent les GenIA académiques utilisant le RAG des GenIA généralistes.

  • Sources de données spécifiques : l’instruction est augmentée avec le contexte récupéré de sources de données externes spécialisées = bases de données bibliographiques. NB Semantic Scholar est la principale et souvent l’unique base utilisée comme source.
  • Extraction des données et non seulement génération pour construire la réponse.

👉 Réponses plus précises, contenu non inventé, vérifications plus simples…

… mais enjeux de fidélité à la source : les réponses extraites ne constituent pas forcément l’objet principal de l’article, ou résultent d’une mauvaise interprétation, ou encore la réponse générée est factuellement vraie mais ne peut pas être confirmée par la source.

Enjeux du recours à l’IA pour la gestion et la rédaction bibliographiques 

Rappel non exhaustif du rôle des citations dans les écrits académiques :

  • fournir des sources en appui aux assertions,
  • permettre la vérification de ces sources,
  • établir la paternité des contributions,
  • mettre en évidence l’étendue et la profondeur de la recherche menée sur un sujet.

Pour cela les citations doivent être [1] exactes et leur sélection [2] pertinente et [3] objective, du moins [4] non biaisée.

🤔 Ces qualités caractérisent-elles généralement les produits d’une GenIA?

Enjeu [1] d’exactitude : erreurs et hallucitations

Les capacités imaginatives des GenIA s’exercent aussi pour les références bibliographiques, produisant au mieux des références inexactes et au pire des références inventées, les “hallucitations”.

Cela a des impacts globaux sur la littérature académique.

Pourquoi les GenIA hallucitent-elles?

  • GenIA conçue pour générer des réponses prioritairement cohérentes et plausibles plutôt qu’exactes, et qui suscitent un retour positif de l’utilisateur.
  • GenIA ne sait pas distinguer les références bibliographiques du texte courant.

👉 Système de transformation de texte et non de recherche d’information.

  • Dépend de la fréquence d’apparition des références dans les données d’entraînement? Les livres et les articles très cités seraient moins sujets aux hallucitations.

Enjeu [2] de pertinence

La pertinence du choix des citations est affectée par :

  • la couverture des données et bases de données sources (y compris pour les IA académiques),
  • les algorithmes aboutissant à la sélection des résultats, ou l’effet “boîte noire” (y compris pour les IA académiques),
  • le fait que les citations sont le plus souvent de 3ème main. Les IA tendent à fournir des références citées sur des pages Wikipedia ; le texte intégral des sources n’est pas intégré dans les données d’entraînement de toutes les IA.

Enjeu [3] d’objectivité

Illusion d’objectivité: croire que les outils d’IA n’ont pas de point de vue ou sont capables de représenter tous les points de vue possibles, alors qu’ils intègrent les points de vue de leurs données d’entraînement et de leurs développeurs.

[traduction adaptée de la légende de la figure]

Fig. 1: Illusions of understanding in AI-driven scientific research. c Illusion of objectivity (Messeri & Crockett, 2024)

Enjeu [4] des biais

  • Fort recouvrement des réponses fournies par des chatbots différents 👉 réponses des AI contraintes à un cadre intellectuel étroit 👉 renforcement du biais de confirmation et des paradigmes existants
  • Renforcement de l’effet Matthieu : auteurs les plus cités = les plus fréquents = les plus à même d’être présents dans les réponses des IA (y compris dans les hallucitations)

Risques et opportunités

  • Illusion non seulement d’objectivité, mais aussi de profondeur explicative et de largeur explicative

  • Risque de perte de compétences : notamment celles d’interprétation, évaluation et analyse, mobilisées par l’activité bibliographique

  • Opportunités : pour certaines tâches répétitives telles que l’encodage d’une liste (textuelle ou tabulée) vers un format informatique bibliographique ou la réécriture de citations et de bibliographie d’un style vers un autre ?

    👉 Réponse dans quelques minutes 🕰️

Typologie des usages, services et outils d’intelligence artificielle pour la rédaction et la gestion bibliographiques

Générer une bibliographie prête à l’emploi

Ou obtenir à partir d’une instruction (prompt) formulée à une GenIA une sélection de références rédigées, en sollicitant une IA généraliste ou une IA académique spécialisée.

Différentes évaluations des performances avec des conclusions partagées :

  • la persistance y compris dans les modèles les plus récents et les IA académiques de problèmes structurels tels que les hallucitations et l’inexactitude des métadonnées,
  • et donc la nécessité de tout vérifier et de tout relire…

Évaluation des bibliographies produites par les GenIA : les problèmes 1/2

Les études évaluant les performances des GenIA relèvent différentes catégories d’anomalies et d’erreurs, sur le fond et/ou la forme.

  • La pertinence du choix des citations : voir supra.
  • Le respect du style demandé : voir infra ; nous verrons ce point en détail concrètement quand nous aborderons la réécriture bibliographique ; voir (Giray, 2024) pour un relevé des manquements à APA7.

Évaluation des bibliographies produites par les GenIA : les problèmes 2/2

  • L’inauthenticité des références : ce sont les hallucitations.
  • L’inexactitude des métadonnées : invention ou emprunt à des références existantes de certaines informations, notamment pour les volumes, numéros, pages et identifiants ; plus largement plutôt pour les données numériques que textuelles.

👉 Voir notamment pour ces 2 aspects : (Bhattacharyya et al., 2023; Cabezas-Clavijo & Sidorenko-Bautista, 2025; Oladokun et al., 2025; Spennemann, 2025; Walters & Wilder, 2023)

Évaluation des bibliographies produites par les GenIA : étude sur 8 chatbots

Parmi les différentes études publiées depuis celle de (Walters & Wilder, 2023), on retient plus particulièrement celle de (Cabezas-Clavijo & Sidorenko-Bautista, 2025), qui analyse les performances de 8 chatbots au travers de 5 domaines disciplinaires, des sciences humaines et sociales aux sciences de la vie.

  • Modèle d’instruction utilisé : “I am a university student working on my Final Degree Project. I need you to provide me with 10 relevant academic references in the field of Sociology. Please format the references in APA 7th edition.”
  • Au total, sur un échantillon de 400 références : 26,5% étaient réelles et exactes, 33,8% réelles et partiellement correctes, 39,8% incorrectes ou inventées.

Taux d’erreur par chatbot

5 éléments pris en compte - en gras ceux qui doivent être exacts pour qu’une référence soit considérée comme correcte :

  • auteur,
  • année,
  • titre,
  • lieu de publication (revue ou éditeur),
  • données de localisation (volume, numéro, pages, DOI).

Figure 1. Percentage of completely correct, partially correct, and incorrect or fabricated references, by AI chatbot (Cabezas-Clavijo & Sidorenko-Bautista, 2025)

Taux d’erreur par domaine disciplinaire

Différences par domaine disciplinaire à relier à la tendance à inventer des références moindre pour les livres que pour les articles : 12,9% de références incorrectes ou inventées pour les livres, 78% pour les articles.

NB tendance chatbots à générer davantage de réfs de livres (58,3%) que de réfs d’articles (39,8%).

Figure 4. Percentage of completely correct, partially correct, and wrong or fabricated references by area of knowledge (Cabezas-Clavijo & Sidorenko-Bautista, 2025)

Se prémunir des références inventées ou inexactes

Les GenIA académiques utilisant le RAG (ex. Undermind, Asta, etc.) permettent de se prémunir des hallucitations et d’avoir davantage de garanties concernant l’exactitude des informations bibliographiques.

Impact de la formulation de l’instruction? Impact de la spécificité, de la complexité de l’instruction et du nombre de références demandées pour éviter les hallucitations (Acut et al., 2025) ; impact de la formulation et du ton pour retrouver des références (même inexactes) utiles (Jensen & Jensen, 2025).

Réécrire une liste de références en changeant le style bibliographique

Il s’agit là de seulement modifier la mise en forme d’une bibliographie, tâche a priori à la portée d’une GenIA généraliste.

👉 Tâches confiées à ChatGPT : réécrire une bibliographie d’un style bibliographique vers un autre. La bibliographie fournie a été créée avec Zotero, à partir d’une bibliothèque locale.

  • Tâche 1 : de ISO-690 vers APA7
  • Tache 2 : de APA7 vers les Presses universitaires de Rennes

Les résultats de ces tests sont dans le dossier tests_IA_reecriture sur le dépôt GitHub du stage > fichier Test_rewrite_Reponses_ChatGPT_APA_PUR.odt] ; ce dossier contient également les bibliographies PUR et APA7 créées avec Zotero.

🤔 Que pensez-vous des résultats? Quelles différences observez-vous entre les bibliographies générées par ChatGPT et celles créées avec Zotero?

Réécriture bibliographique avec Thrix : un usage pédagogique?

Le service en ligne Thrix promet de standardiser le style, corriger les erreurs, assurer la complétude et augmenter le contenu des citations et bibliographie.

Thrix : entrée

Thrix autorise en entrée le téléchargement d’un fichier au format .docx et le copier-coller de texte ou d’identifiants. En sortie, il propose les principaux styles bibliographiques et des options simplifiées : Correct and consistent, Just sort alphabetically, etc.

Thrix : sortie

En plus de la sortie rédigée, Thrix offre une interface de suivi des modifications, pour valider ou refuser les changements proposés.

Analyser et enrichir sa bibliothèque

  • Analyser un corpus de PDF 👉 on en parle en détail juste après avec les intégrations Zotero
  • Enrichir sa bibliothèque à partir de quelques articles “graines” avec les services de recommandation tels que Research Rabbit et Connected Papers

Enrichir sa bibliothèque avec Research Rabbit et Connected Papers

Comparatif de Research Rabbit et Connected Papers - Tableau complet incluant Citation Chaser

Mise en application dans Zotero : de l’IA à toutes les étapes de la bibliographie ?

Importer des références bibliographiques depuis un texte ou un tableur

Transformer une bibliographie textuelle en un fichier de références pouvant être importé dans Zotero, voilà un des services que l’on peut attendre d’une GenIA. On peut distinguer 2 cas de figure.

  • Liste de références fournie sous la forme d’un texte rédigé, au format .docx, .pdf ou autre. Si on dispose d’un fichier .docx ou .odt dans lequel les citations ont été insérées avec Mendeley ou Zotero et sont encore actives, le service Reference Extractor demeure une très bonne option.
  • Liste de références fournie sous la forme d’un tableur, au format .xlsx, .csv ou autre.

Convertir au format BibTeX une liste de références rédigée

Nous allons pour cette tâche comparer les résultats obtenu par 3 services. Les fichiers à utiliser sont dans le dossier test_IA_conversion.

  • AnyStyle.io : copier-coller les références du fichier Test_texte_to_bibtex.docx dans l’interface, puis générer le fichier BibTex et l’importer dans Zotero

  • ChatGPT : le fichier BibTeX à importer est déjà prêt

  • Extension de Zotero Add Items from Text - à installer avec Add-on Market for Zotero

🤔 Que pensez-vous des performances de chacun des services? Comment évaluez-vous les résultats produits?

Convertir au format BibTeX une liste de références tabulée

Cette fois on a sollicité seulement ChatGPT, avec le fichier Test_excel_to_bibtex.xlsx, joint à l’instruction : “Pourrais-tu convertir au format BibTex les références bibliographiques listées dans le fichier Excel ci-joint?”

🤔 Importez le fichier résultant Test_excel_to_bib_chatGPT20250806.bib dans Zotero. Quel bilan tirez-vous?

Analyser sa bibliothèque : vue d’ensemble

3 options possibles.

  • Connecter sa bibliothèque Zotero à une IA externe dans Zotero : voir fiche dédiée ChatGPT, Claude, etc. dans ma bibliothèque Zotero.
  • Intégrer une IA 100% locale à sa bibliothèque Zotero : extension Beaver et extension ZotSeek. ⚠️ Ce service ne génère pas de texte, il vise la recherche au sein de la bibliothèque Zotero.
  • Intégrer sa bibliothèque Zotero à un service d’IA en ligne : intégration Consensus - 👉 🕰️ à suivre

Analyser sa bibliothèque : intégration Consensus ½

Au lieu de mettre de l’IA dans sa bibliothèque, on va donc mettre sa bibliothèque dans l’IA grâce à la nouvelle intégration de Consensus.

  1. Avoir un compte Zotero et un compte Consensus
  2. Depuis son compte Consensus, cliquer sur Zotero Import pour importer sa bibliothèque Zotero dans sa bibliothèque Consensus

Analyser sa bibliothèque : intégration Consensus 2/2

En plus des requêtes d’analyse standard d’une IA, Consensus permet de créer des chronologies, identifier les lacunes (gaps) et rechercher des articles pour combler ces lacunes.

Chronologie des articles d’une collection dans Zotero

Créer un style CSL

Des tâches de codage informatique à confier à une GenIA ? 2 tests effectués entre le 6 et le 14 août 2025.

  • Création d’un style CSL à partir de consignes et d’exemples textuels contenus dans un fichier .docx : tâche 1 confiée à ChatGPT et à DeepSeek.
  • Modifications mineures (et simples pour une intelligence humaine) d’un style CSL existant : tâche 2 confiée à ChatGPT et à GitHub Copilot.

Je voudrais apporter des modifications au style CSL ci-joint. Je voudrais que les noms d’auteur ne soient pas en petites capitales, que les prénoms soient écrits en entier et que les titres soient entre guillemets. Pourrais-tu modifier le code pour obtenir ce résultat?

Créer un style CSL : tâche 1

Chat GPT

  • Analyse des consignes et fourniture d’un modèle général plutôt bonne, mais…
  • Fichier invalide → élément style + élément text (ne peut pas être enfant de name).
  • Bonnes pratiques d’écriture non respectées : pour les guillemets, la ponctuation, etc.

DeepSeek

  • Fichier invalide → attributs non autorisés.
  • Bonnes pratiques d’écriture non respectées : pour les guillemets, la ponctuation, etc. 

Créer un style CSL : tâche 2

Chat GPT

  • Fichier non valide.
  • Récapitulatif des corrections prometteur, mais… toujours des petites capitales, les prénoms pas en entier et la même mauvaise option que pour la tâche 1 pour les guillemets.

GitHub Copilot

  • Fichier commenté et récapitulatif précis des changements effectués.
  • Petites capitales supprimées, mais… les prénoms pas en entier et la même mauvaise option que ChatGPT et DeepSeek pour les guillemets.

Créer un style CSL : les fichiers des tests

Les instructions, les réponses des IA et les fichiers CSL sont sur le dépôt GitHub du stage, dans le dossier Tests IA et CSL.

Questions et conclusion

Contact et liens utiles

📧 frederique.flamerie@pm.me

🔗 https://frederique-flamerie.fr

📑 Support du stage “Gestion et rédaction bibliographiques avec l’IA”

Références citées

Télécharger les références citées : bibliographie au format PDF et fichier bibliographique au format BIB

Acut, D. P., Malabago, N. K., Malicoban, E. V., Galamiton, N. S., & Garcia, M. B. (2025). « ChatGPT 4.0 Ghosted Us While Conducting Literature Search: » Modeling the Chatbot’s Generated Non-Existent References Using Regression Analysis. Internet Reference Services Quarterly, 29(1), 27‑54. https://doi.org/10.1080/10875301.2024.2426793
Andersen, J. P., Degn, L., Fishberg, R., Graversen, E. K., Horbach, S. P. J. M., Schmidt, E. K., Schneider, J. W., & Sørensen, M. P. (2025). Generative Artificial Intelligence (GenAI) in the Research Process – A Survey of Researchers’ Practices and Perceptions. Technology in Society, 81, 102813. https://doi.org/10.1016/j.techsoc.2025.102813
Bhattacharyya, M., Miller, V. M., Bhattacharyya, D., & Miller, L. E. (2023). High Rates of Fabricated and Inaccurate References in ChatGPT-Generated Medical Content. Cureus, 15(5), e39238. https://doi.org/10.7759/cureus.39238
Bouchard, A. (2025a). Former les usagers à l’heure de ChatGPT : IA et compétences informationnelles (formation de formateurs).
Bouchard, A. (2025b). IA et Recherche Documentaire : ChatGPT et Les Autres. Callisto Formation.
Bouchard, A. (2025c). ”#WorkInProgress : IA Générative et Outils de Recherche de Littérature Académique”. In URFISTinfo.
Cabezas-Clavijo, Á., & Sidorenko-Bautista, P. (2025). Assessing the Performance of 8 AI Chatbots in Bibliographic Reference Retrieval: Grok and DeepSeek Outperform ChatGPT, but None Are Fully Accurate (arXiv:2505.18059). arXiv. https://doi.org/10.48550/arXiv.2505.18059
Camp, N. T., Bengtson, J. A., & Sandstrom, J. C. (2025). The Citation Catastrophe: Propagation of AI-generated Counterfeit Citations in Scholarship. The Journal of Academic Librarianship, 51(4), 103065. https://doi.org/10.1016/j.acalib.2025.103065
Giray, L. (2024). ChatGPT References Unveiled: Distinguishing the Reliable from the Fake. Internet Reference Services Quarterly, 28(1), 9‑18. https://doi.org/10.1080/10875301.2023.2265369
Hutchins, M. (2025). Every Reason Why I Hate AI and You Should Too. In MalwareTech. https://malwaretech.com/2025/08/every-reason-why-i-hate-ai.html.
Jensen, T. W., & Jensen, S. W. (2025). AI Literacy in the Context of Working with Sources: Pitfalls and Possibilities of Generative AI Models in Academic Writing. Journal of Academic Writing, 14(S2 2025), 1‑12. https://doi.org/10.18552/joaw.v15iS2.1224
Kousha, K. (2024). How Is ChatGPT Acknowledged in Academic Publications? Scientometrics, 129(12), 7959‑7969. https://doi.org/10.1007/s11192-024-05193-y
Lenharo, M. (2024). ChatGPT Turns Two: How the AI Chatbot Has Changed Scientists’ Lives. Nature, 636(8042), 281‑282. https://doi.org/10.1038/d41586-024-03940-y
Lund, B. D., Wang, T., Mannuru, N. R., Nie, B., Shimray, S., & Wang, Z. (2023). ChatGPT and a New Academic Reality: Artificial Intelligence-written Research Papers and the Ethics of the Large Language Models in Scholarly Publishing. Journal of the Association for Information Science and Technology, 74(5), 570‑581. https://doi.org/10.1002/asi.24750
Maraninchi, F. (2025). Pourquoi je n’utilise pas ChatGPT. In Academia. https://doi.org/10.58079/1382x
Mekhfi, I. (2024). Utiliser les IA génératrices pour Zotero. In ArchéO’liens. https://doi.org/10.58079/11pj3
Messeri, L., & Crockett, M. J. (2024). Artificial Intelligence and Illusions of Understanding in Scientific Research. Nature, 627(8002), 49‑58. https://doi.org/10.1038/s41586-024-07146-0
Oladokun, B. D., Enakrire, R. T., Emmanuel, A. K., Ajani, Y. A., & Adetayo, A. J. (2025). Hallucitation in Scientific Writing: Exploring Evidence from ChatGPT Versions 3.5 and 4o in Responses to Selected Questions in Librarianship. Journal of Web Librarianship, 19(1), 62‑92. https://doi.org/10.1080/19322909.2025.2482093
Orduña-Malea, E., & Cabezas-Clavijo, Á. (2023). ChatGPT and the Potential Growing of Ghost Bibliographic References. Scientometrics, 128(9), 5351‑5355. https://doi.org/10.1007/s11192-023-04804-4
Pascal, F., & Taddei, F. (2025). IA et enseignement supérieur : formation, structuration et appropriation. Ministère de l’enseignement supérieur et de la recherche.
Resnik, D. B., & Hosseini, M. (2025). The Ethics of Using Artificial Intelligence in Scientific Research: New Guidance Needed for a New Tool. AI and Ethics, 5(2), 1499‑1521. https://doi.org/10.1007/s43681-024-00493-8
Schläfer, A. (2023). Importer des références bibliographiques non-formatées dans zotero avec anystyle ou avec l’aide de ChatGPT. In Germano-Fil. https://doi.org/10.58079/p0zy
Spennemann, D. H. R. (2025). The Origins and Veracity of References « Cited » by Generative Artificial Intelligence Applications: Implications for the Quality of Responses. Publications, 13(1), 12. https://doi.org/10.3390/publications13010012
Tay, A. (2025). A 2025 Deep Dive of Consensus: Promises and Pitfalls in AI-Powered Academic Search. In Aaron Tay’s Musings about Librarianship.
Walters, W. H., & Wilder, E. I. (2023). Fabrication and Errors in the Bibliographic Citations Generated by ChatGPT. Scientific Reports, 13(1), 14045. https://doi.org/10.1038/s41598-023-41032-5
Zhao, A. (2025). Emerging AI Tools for Literature Review.